iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 4
0
自我挑戰組

資料處理以及視覺化系列 第 4

R語言-第四天的鐵達尼 - 基本資訊Q2、Q3

  • 分享至 

  • xImage
  •  

持續接續Q2、Q3

Q2 : 參加的男生還是女生比較多
Q3 : 平均票價是多少錢呢?

library(titanic)
library(dplyr)
#資料集
raw = titanic_train

A2 

raw %>% group_by(Sex) %>% summarise(次數 = n())
# A tibble: 2 x 2
  Sex     次數
  <chr>  <int>
1 female   314
2 male     577
男性比女性多出263人

A3

raw %>% summarise(平均票價 = mean(Fare))
mean(raw$Fare)
> raw %>% summarise(平均票價 = mean(Fare))
  平均票價
1 32.20421
> mean(raw$Fare)
[1] 32.20421

當然計算平均值 , 可以直接使用mean()計算

出乎意料的沒想到平均票價僅32元(應該為美金) , 這裡面究竟有什麼謎呢....


上一篇
R語言-第三天的鐵達尼 - 基本資訊Q1
下一篇
R語言-第五天的鐵達尼 - 條件搜尋統計
系列文
資料處理以及視覺化30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言